智能论文笔记

Recognizing Families In the Wild (RFIW): The 5th Edition

Joseph P. Robinson , Can Qin , Ming Shao , Matthew A. Turk , Rama Chellappa , Yun Fu

分类：计算机视觉

2021-10-31

识别野外（RFIW）的家庭，作为数据挑战，与第16届IEEE国际自动面部和手势识别（FG）一起举行，是一种大规模的多轨视觉亲属识别评估。这是我们第五版RFIW，我们继续努力吸引学者，将专业人士，发布新工作和讨论前景。在本文中，我们总结了今年RFIW三个任务的提交：特别是，我们审查了亲属验证，三对象验证和家庭成员搜索和检索的结果。我们来看看RFIW问题，以及分享当前的努力，并为未来的未来方向提出建议。

translated by 谷歌翻译

Balancing Biases and Preserving Privacy on Balanced Faces in the Wild

Joseph P Robinson , Can Qin , Yann Henon , Samson Timoner , Yun Fu

分类：计算机视觉 | 人工智能

2021-03-16

当前用于面部识别的模型（FR）中存在人口偏见。我们在野外（BFW）数据集中平衡的面孔是衡量种族和性别亚组偏见的代理，使一个人可以表征每个亚组的FR表现。当单个分数阈值确定样本对是真实还是冒名顶替者时，我们显示的结果是非最佳选择的。在亚组中，性能通常与全球平均水平有很大差异。因此，仅适用于与验证数据相匹配的人群的特定错误率。我们使用新的域适应性学习方案来减轻性能不平衡，以使用最先进的神经网络提取的面部特征。该技术平衡了性能，但也可以提高整体性能。该建议的好处是在面部特征中保留身份信息，同时减少其所包含的人口统计信息。人口统计学知识的去除阻止了潜在的未来偏见被注入决策。由于对个人的可用信息或推断，因此此删除可改善隐私。我们定性地探索这一点；我们还定量地表明，亚组分类器不再从提出的域适应方案的特征中学习。有关源代码和数据描述，请参见https://github.com/visionjo/facerec-bias-bfw。

translated by 谷歌翻译

On Optimizing the Communication of Model Parallelism

Yonghao Zhuang , Hexu Zhao , Lianmin Zheng , Zhuohan Li , Eric P. Xing , Qirong Ho , Joseph E. Gonzalez , Ion Stoica , Hao Zhang

分类：机器学习

2022-11-10

We study a novel and important communication pattern in large-scale model-parallel deep learning (DL), which we call cross-mesh resharding. This pattern emerges when the two paradigms of model parallelism - intra-operator and inter-operator parallelism - are combined to support large models on large clusters. In cross-mesh resharding, a sharded tensor needs to be sent from a source device mesh to a destination device mesh, on which the tensor may be distributed with the same or different layouts. We formalize this as a many-to-many multicast communication problem, and show that existing approaches either are sub-optimal or do not generalize to different network topologies or tensor layouts, which result from different model architectures and parallelism strategies. We then propose two contributions to address cross-mesh resharding: an efficient broadcast-based communication system, and an "overlapping-friendly" pipeline schedule. On microbenchmarks, our overall system outperforms existing ones by up to 10x across various tensor and mesh layouts. On end-to-end training of two large models, GPT-3 and U-Transformer, we improve throughput by 10% and 50%, respectively.

translated by 谷歌翻译

Robust MADER: Decentralized and Asynchronous Multiagent Trajectory Planner Robust to Communication Delay

Kota Kondo , Jesus Tordesillas , Reinaldo Figueroa , Juan Rached , Joseph Merkel , Parker C. Lusk , Jonathan P. How

分类：机器人

2022-09-27

尽管沟通延迟可能会破坏多种系统，但大多数现有的多基因轨迹计划者都缺乏解决此问题的策略。最先进的方法通常采用完美的通信环境，这在现实世界实验中几乎是现实的。本文介绍了强大的Mader（RMADER），这是一个分散的异步多轨迹计划者，可以处理代理商之间的通信延迟。通过广播新优化的轨迹和忠实的轨迹，并执行延迟检查步骤，Rmader即使在通信延迟下也能够保证安全。Rmader通过广泛的仿真和硬件飞行实验得到了验证，并获得了100％的无碰撞轨迹生成成功率，表现优于最先进的方法。

translated by 谷歌翻译

Design and Implementation of a Human-Robot Joint Action Framework using Augmented Reality and Eye Gaze

Wesley P. Chan , Morgan Crouch , Khoa Hoang , Charlie Chen , Nicole Robinson , Elizabeth Croft

分类：机器人

2022-08-25

当人类共同完成联合任务时，每个人都会建立一个情况的内部模型以及如何发展。有效的协作取决于这些单个模型如何重叠以在团队成员之间形成共同的心理模型，这对于人类机器人团队中的协作流程很重要。准确的共享心理模型的发展和维护需要个人意图的双向交流以及解释其他团队成员意图的能力。为了实现有效的人类机器人协作，本文介绍了人类机器人团队合作中新型联合行动框架的设计和实施，利用增强现实（AR）技术和用户眼目光来实现意图的双向交流。我们通过与37名参与者的用户研究测试了我们的新框架，发现我们的系统提高了任务效率，信任和任务流利。因此，使用AR和眼睛凝视使双向交流是一种有前途的平均值，可以改善影响人与机器人之间协作的核心组成部分。

translated by 谷歌翻译

Bayesian Pseudo Labels: Expectation Maximization for Robust and Efficient Semi-Supervised Segmentation

Mou-Cheng Xu , Yukun Zhou , Chen Jin , Marius de Groot , Daniel C. Alexander , Neil P. Oxtoby , Yipeng Hu , Joseph Jacob

分类：计算机视觉 | 人工智能 | 机器学习

2022-08-08

本文涉及分割中的伪标记。我们的贡献是四倍。首先，我们提出了伪标签的新表述，作为一种预期最大化（EM）算法，用于清晰的统计解释。其次，我们纯粹基于原始伪标记，即Segpl，提出了一种半监督的医学图像分割方法。我们证明，SEGPL是针对针对2D多级MRI MRI脑肿瘤分段任务和3D二进制CT肺部肺血管分段任务的半监督分割的最新一致性正则方法的竞争方法。与先前方法相比，SEGPL的简单性允许更少的计算成本。第三，我们证明了SEGPL的有效性可能源于其稳健性抵抗分布噪声和对抗性攻击。最后，在EM框架下，我们通过变异推理引入了SEGPL的概率概括，该推论学习了训练期间伪标记的动态阈值。我们表明，具有变异推理的SEGPL可以通过金标准方法深度集合在同步时执行不确定性估计。

translated by 谷歌翻译

A Frequency-Velocity CNN for Developing Near-Surface 2D Vs Images from Linear-Array, Active-Source Wavefield Measurements

Aser Abbas , Joseph P. Vantassel , Brady R. Cox , Krishna Kumar , Jodie Crocker

分类：机器学习

2022-07-19

本文介绍了频率卷积神经网络（CNN），用于快速，无创的2D剪切波速度（VS）成像的近表面地质材料。在频速度域中运行，可以在用于生成CNN输入的线性阵列，主动源实验测试配置中具有显着的灵活性，这些配置是归一化的分散图像。与波场图像不同，标准化的分散图像对实验测试配置相对不敏感，可容纳各种源类型，源偏移，接收器数量和接收器间距。我们通过将其应用于经典的近乎表面地球物理学问题，即成像两层，起伏的土壤 - 旁质界面的界面来证明频率CNN的有效性。最近，通过开发一个时间距离CNN来研究这个问题，该问题表现出了很大的希望，但在使用不同的现场测试配置方面缺乏灵活性。本文中，新的频道CNN显示出与时距CNN的可比精度，同时提供了更大的灵活性来处理各种现场应用程序。使用100,000个合成近表面模型对频率速度CNN进行了训练，验证和测试。首先，使用训练集的合成近表面模型测试了提议的频率CNN跨各种采集配置概括跨各种采集配置的能力，然后应用于在Austin的Hornsby Bend在Austin的Hornsby Bend收集的实验场数据美国德克萨斯州，美国。当针对更广泛的地质条件范围充分开发时，提出的CNN最终可以用作当前伪2D表面波成像技术的快速，端到端替代方案，或开发用于完整波形倒置的启动模型。

translated by 谷歌翻译

Latency Control for Keyword Spotting

Christin Jose , Joseph Wang , Grant P. Strimel , Mohammad Omar Khursheed , Yuriy Mishchenko , Brian Kulis

分类：人工智能 | 机器学习

2022-06-15

会话代理通常使用关键字发现（KWS）来启动与用户的语音交互。对于用户体验和隐私考虑，现有的KWS方法主要关注准确性，这通常可以以牺牲引入延迟为代价。为了解决这一权衡，我们提出了一种新的方法来控制KWS模型延迟，并在没有明确了解关键字端点的情况下将其推广到任何损失函数。通过单个可调的超参数，我们的方法使人们能够平衡目标应用程序的检测潜伏期和准确性。从经验上讲，我们表明，与现有方法相比，我们的方法在延迟限制下具有出色的性能。也就是说，与基线的最新面积相比，我们对固定延迟目标进行了实质性25 \％的相对错误接受改进。我们还表明，与交叉熵损失相比，当我们的方法与最大造成的损失结合使用时，我们能够在固定潜伏期时将相对错误接受提高25％。

translated by 谷歌翻译

Universal characteristics of deep neural network loss surfaces from random matrix theory

Nicholas P Baskerville , Jonathan P Keating , Francesco Mezzadri , Joseph Najnudel , Diego Granziol

分类：机器学习

2022-05-17

本文考虑了深神经网络中随机矩阵普遍性的几个方面。在最近的实验工作中，我们使用与局部统计相关的随机矩阵的普遍特性，以基于其Hessians的现实模型来获得对深神经网络的实际含义。特别是，我们得出了深度神经网络光谱中异常值的普遍方面，并证明了随机矩阵局部定律在流行的预处理梯度下降算法中的重要作用。我们还通过基于统计物理学和随机矩阵理论的工具的一般参数，对深度神经网络损失表面的见解。

translated by 谷歌翻译

An Artificial Intelligence Dataset for Solar Energy Locations in India

Anthony Ortiz , Dhaval Negandhi , Sagar R Mysorekar , Joseph Kiesecker , Shivaprakash K Nagaraju , Caleb Robinson , Priyal Bhatia , Aditi Khurana , Jane Wang , Felipe Oviedo

分类：机器学习

2022-01-31

可再生能源的快速开发，尤其是太阳能光伏（PV），对于缓解气候变化至关重要。结果，印度设定了雄心勃勃的目标，可以在2030年之前安装500吉瓦的太阳能容量。鉴于预计大量的足迹可以满足可再生能源能源目标，因此对环境价值的土地利用冲突的潜力很高。为了加快太阳能的发展，土地使用计划者将需要访问PV基础设施的最新，准确的地理空间信息。在这项工作中，我们开发了一种露骨的机器学习模型，以使用自由使用的卫星图像绘制印度的公用事业规模的太阳能项目，平均准确性为92％。我们的模型预测得到了人类专家的验证，以获取1363个太阳能光伏农场的数据集。使用此数据集，我们测量了整个印度的太阳足迹，并量化了与PV基础设施发展相关的土地盖修改程度。我们的分析表明，印度超过74％的太阳能发展是建立在具有自然生态系统保护或农业价值的陆生类型上的。

translated by 谷歌翻译